Task-Platzierung auf Many-Core-Prozessoren mit fehlerhaften Komponenten

نویسنده

  • Sebastian Schlingmann
چکیده

This thesis describes the development and evaluation of three algorithms for the placement of parallelized applications on future many-core processors. The algorithms are able to compensate for permanent hardware faults and thereby cause a graceful degradation rather than a program crash. The fault model considers permanently failed cores, routers and processor interconnect links. The main goal of the placement algorithms is a working placement of applications, which consist of individual tasks communicating with each other, onto a many-core processor. The placement has to retain a high communication performance for each application. Since the algorithms are executed at the beginning of each program it is required that the runtime of the placement decision does not to grow excessively. Many-core processors and applications are modelled as graphs which depict the communication structures, as well as the intensities of the communications. Both synthetic task graphs and task graphs derived from real world applications are considered. This thesis develops the Connectivity-Sensitive Algorithm that generates static placements, which try to keep the distance between the tasks small. As a further refinement the Fitting Algorithm and the Favorite Neighbor Algorithm are presented. These two extensions to the basic algorithm are supposed to be beneficial in the placement of multiple task graphs and in the placement of task graphs with a strong imbalance of communication intensities. Also methods to extend the static placements by dynamic processes are presented, which require changes to the hardware and the general placement strategy. In a detailed evaluation chapter all aspects of the task placement on potentially faulty many-core processors are considered. Placement in both the error-free case, as well as placement assuming faulty hardware components is investigated. The effect of any error supported by the error model is first analyzed individually, before combinations of errors are considered. The results are compared and contrasted with those of a well known algorithm from the literature and two simple placement metrics. Different network topologies and the bandwidth constraints of the on-chip network are also discussed. It turns out that the described Connectivity-Sensitive Algorithm is in most cases able to generate the placements with the lowest communication overhead, and is also able to find valid placements in the presence of high error rates. The two extended algorithms are not able to generate better results.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Die Multicore-Transformation und ihre Herausforderung an die Softwaretechnik

Mehrkern-Rechner sind im Begriff, zu übernehmen. Mobiltelefone werden bereits mit Doppelprozessoren ausgestattet, Tablettrechner mit vier Prozessoren, PCs mit acht und mehr, Server mit Dutzenden, und GPUs mit einem halben Tausend. Diese Entwicklung stellt die Softwaretechnik vor die Herausforderung, parallele Software mit der gleichen Qualität und zu gleichen Kosten wie sequentielle herzustelle...

متن کامل

Many-Core-Architekturen zur Datenbankbeschleunigung

Physikalische und technologische Grenzen bei der Erhöhung der Taktfrequenz von Prozessoren haben in den letzten Jahren die Entwicklung von Multiund Many-CoreArchitekturen forciert. Die Ausnutzung dieser Architekturen erfordert jedoch eine weitgehende Parallelisierung von Berechnungen. Für den Datenbankbereich bedeutet dies einerseits ein Überdenken etablierter Datenstrukturen und Verfahren, erö...

متن کامل

Virtualisierung bei Eingebetteten Multicore Systemen: Integration und Isolation sicherheitskritischer Funktionen

Virtualisierung ist nicht nur ein aktuelles Thema für Rechenzentren und deren Server. Auch bei sicherheitskritischen, eingebetteten Systemen werden Virtualisierungstechnologien eingesetzt. Dieser Trend ist auch das Ergebnis einer zunehmenden Verwendung von Mehrkern Prozessoren zur Erhöhung der Funktionsdichte und zur weiteren Senkung der Kosten. Diese Arbeit beschreibt die Verwendung von Virtua...

متن کامل

Laufzeitoptimierte VHDL Bibliothek zur Verifikation und Simulation Kryptographischer Prozessoren

Kurzfassung: In diesem Beitrag wird eine umfassende Bibliothek mit arithmetischen und kryptographischen Funktionen vorgestellt. Diese Bibliothek wurde in VHDL entwickelt und unterstützt sowohl Langzahlarithmetik als auch Multiple Precision Arithmetic (MPA). Dadurch eignet sich die Bibliothek insbesondere zur simulatorunabhängigen Simulation und Verifikation kryptographischer Prozessoren, die au...

متن کامل

Komponenten-basierte Metadatenschemata und Facetten-basierte Suche - Ein flexibler und universeller Ansatz

The content description of various kinds of research data using metadata requires other than bibliographical data fields that are alone not sufficient for this purpose. To properly account for research data, other metadata fields are required, often specific to a given research data set. Consequently, metadata profiles adapted to different types of resources need to be created. These are define...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2013